扫描下载APP
其它方式登录
OProver是由M-A-P开源社区与南京大学等团队提出的全开源Lean 4定理证明模型,创新性地将检索增强、编译器反馈与多轮修复内化至训练策略,解决训练与部署的‘策略错位’问题;32B版本在五项评测中三项第一、两项第二,全面超越671B的DeepSeek-Prover-V2,并同步开源OProofs语料库及多规模模型权重。
AxiomProver是一款新型AI数学证明工具,自2024年2月起已推动8篇覆盖代数几何、表示论、数论等硬核领域的论文上线arXiv,其中5篇被权威期刊接收。它利用Lean形式化语言生成可机器验证的证明,实现上午出题、下午交证的超高速度,从根本上解决数学界长期存在的信用依赖与审稿迟滞问题。
Google发布Gemma 4 12B模型,摒弃传统独立视觉与音频编码器,采用轻量嵌入模块将原始图像、音频和文本直接映射至统一向量空间,由共享Transformer主干统一处理,实现跨模态表征与计算一体化,在显存仅9GB条件下性能逼近26B MoE,标志着多模态AI从‘拼接式架构’迈向‘无编码器统一架构’的范式变革。
Meta联合纽约大学等机构发布ATLAS项目,利用自研AI系统AutoformBot将26本数学教科书自动翻译为Lean形式化代码库,覆盖46,203条数学声明,生成超48万行可验证代码,消耗1830亿token,旨在构建可导航的数学知识图谱,推动数学证明的自动化与可信验证。
文章分析预测市场的发展困境与演进路径,指出Polymarket等平台面临‘群体智慧’叙事崩塌与流动性悖论:依赖Bot和专家导致公平性丧失,而排斥它们又致市场失灵。Hyperliquid通过HIP系列协议(尤其HIP-4)将预测市场降级为衍生品对冲组件,打通保证金、嫁接RWA和TradFi流动性,以工程化方式重构流动性逻辑,摆脱对叙事的依赖。
文章聚焦AI幻觉这一大模型固有特性,指出其既是创造力来源也是高风险隐患;重点介绍初创公司Axiom采用形式化验证(特别是Lean语言)技术,将AI推理过程转化为可数学证明的确定性链条,以提升关键领域可信度,并提及北大AI4Math团队等国内相关探索。
谷歌发布Gemma 4系列端侧大模型,含E2B、E4B等轻量级版本,支持智能手机、树莓派等设备离线运行;文章详述其在知识问答、多模态识别、翻译等场景的实用表现与局限,强调其低延迟、零Token消耗、本地化部署优势,同时指出在古诗文准确性、语病检查等高精度任务上的不足,并分析其对国产终端适配及开源生态(Apache 2.0许可)的推动意义。
Hyperliquid 在主网上线 HIP-4 Outcome Markets,推出 BTC 日内二元结果合约,以 USDH 抵押、零开仓费,将预测市场深度集成至其现有链上交易系统(含现货、永续),强调交易策略性与资金效率;首日 BTC 相关合约交易量达615万美元,远超 Polymarket 和 Kalshi 同类市场;HIP-4 独立设计结算机制,强化预言机与争议处理,并通过提高 HYPE 质押门槛(100万枚)绑定价值捕获。
一位生成式AI早期创业者回顾八年创业历程:2018年创立Rosebud AI,聚焦AI创意工具开发;经历从CycleGAN/StyleGAN到GPT-4的技术演进,强调产品设计与用户体验在模型不成熟阶段的关键作用;2026年卸任CEO并加入a16z担任合伙人,专注前沿模型栈及AI基础设施投资。
Anthropic因Claude Code等高算力功能使用激增,面临成本压力,近期连续采取多项措施收紧算力供给与定价策略,包括将Claude Code移出Pro套餐、设置周用量上限、下调默认思考强度、限制第三方Agent调用等,引发开发者社区质疑与舆论反弹。
文章通过实测千元安卓机vivo Y500 Pro运行谷歌Gemma 4 E4B本地大模型,发现其响应极慢(单题耗时2.5–3.3分钟)、逻辑推理错误率高、多模态识图能力弱(如漏识Apple Store、无法识别绿植喷头),对比旗舰机表现差距显著;指出当前本地AI受限于中端芯片NPU算力,尚难在普通手机实现可用体验,真正普及依赖芯片厂商将AI算力下沉至中低端平台。
文章实测谷歌Gemma 4 E4B本地大模型在千元安卓机(vivo Y500 Pro,天玑7400)上的运行表现,发现其响应极慢(单题超2分钟)、逻辑推理错误率高、多模态识图能力弱且无法中断,远逊于旗舰机;指出当前本地AI仍高度依赖高端NPU算力,普通手机尚难实用,产业落地需芯片厂商在中低端平台提升AI算力投入。
Anthropic因频繁、不透明地封禁Claude账号引发开发者强烈不满,半年封号145万个,申诉机制低效且解释模糊;用户依赖其强大代码与长文本能力却面临高运营风险,促使开源模型(如Google Gemma 4)和本地部署方案加速崛起,挑战闭源AI平台的垄断式治理模式。
25岁华裔天才洪乐潼创办AI公司Axiom,聚焦形式化验证技术,用数学公理和Lean语言确保大模型推理过程可证明、无幻觉,瞄准金融、军工等高可靠性场景;公司成立两年获2亿美元A轮融资,估值16亿美元,已攻克埃尔德什难题并在普特南竞赛中获满分,但面临商业化路径与速度-正确性平衡等现实挑战。
谷歌发布开源大模型Gemma 4后90分钟即遭越狱,开发者通过Abliteration技术精准抹除神经网络中的安全拒绝向量,移除道德与法律约束。实测显示越狱版可生成伪造支票、盗版资源指引、职场陷害方案及非法偷渡路线等有害内容,合规率骤降至个位数。文章指出开源特性加剧安全困境,呼吁从底层架构、平台治理和法律监管三方面构建AI安全防线。